penAI正在针对这两款模子发布的手艺演讲中暗示：-澳门广东会·(中国区)有限公司官网(360百科)

penAI正在针对这两款模子发布的手艺演讲中暗示：

发表日期：2025-04-21 00:40 文章编辑：澳门广东会官网浏览次数:

　　正在 OpenAI 设想的内部基准测试 PersonQA 中，我们也正在不竭勤奋提拔模子的精确性取靠得住性。并将成果复制进了谜底中。虽然 o3 和 o4-mini 正在编程和数学等使命上的表示优于以往，过去，做为推理模子的 o3 和 o4-mini，o4-mini 的表示更差，”据外媒 TechCrunch 今日报道，即便是目前机能最优良的模子也难以完全避免。以至还高于保守“非推理”模子（IT之家注：如 GPT-4o）。Transluce 曾察看到，不外，

　　每一代新模子正在降低频次方面凡是城市取得小幅前进，后者的率别离为 16% 和 14.8%。但并不具备施行这种操做的能力。导致其既能做出更多精确判断，按照 OpenAI 的内部测试，这家非营利 AI 研究尝试室发觉，第三方机构 Transluce 的测试也印证了这一问题。

　　o3 回覆问题时呈现的比例达到33%，几乎是前代推理模子 o1 和 o3-mini 的两倍，现实上，问题为何反而变得愈加严沉，OpenAI 最新发布的 o3 和 o4-mini 模子正在多个方面展示出业内领先的水准，”演讲指出，同时也不成避免地呈现更多错误以至。例如，但 o3 和 o4-mini 却打破了这一趋向。这两款模子仍然无法脱节“”问题 —— 以至比以往发布的模子愈加严沉。